Clustering de données relationnelles pour la structuration de flux télévisuels
نویسندگان
چکیده
Résumé. Les approches existantes pour structurer automatiquement un flux de télévision (i.e. reconstituer un guide de programme exact et complet), sont supervisées. Elles requièrent de grandes quantités de données annotées manuellement, et aussi de définir a priori les types d’émissions (publicités, bandes annonces, programmes, sponsors...). Pour éviter ces deux contraintes, nous proposons une classification non supervisée. La nature multi-relationnelle de nos données proscrit l’utilisation des techniques de clustering habituelles reposant sur des représentations sous forme attributs-valeurs. Nous proposons et validons expérimentalement une technique de clustering capable de manipuler ces données en détournant la programmation logique inductive (PLI) pour fonctionner dans ce cadre non supervisé.
منابع مشابه
La prise en compte de la dimension temporelle dans la classification de données
Résumé. Dans un contexte d’ingénierie de la connaissance, l’analyse des données relationnelles évolutives est une question centrale. La représentation de ce type de données sous forme de graphe optimisé en facilite l'analyse et l'interprétation par l’utilisateur non expert. Cependant, ces graphes peuvent rapidement devenir trop complexes pour être étudiés dans leur globalité, il faut alors les ...
متن کاملDécouverte de proportions analogiques dans les bases de données : une première approche
Résumé. Cet article présente un nouveau cadre pour la découverte de connaissances basé sur la notion de proportion analogique qui exprime l’égalité des rapports entre les attributs de deux paires d’éléments. Cette notion est développée dans le contexte des bases de données pour découvrir des parallèles dans les données. Dans un premier temps, nous donnons une définition formelle des proportions...
متن کاملClustering topologique pour le flux de données
Résumé. Actuellement, le clustering de flux de données devient le moyen le plus efficace pour partitionner un très grand ensemble de données. Dans cet article, nous présentons une nouvelle approche topologique, appelée G-Stream, pour le clustering de flux de données évolutives. La méthode proposée est une extension de l’algorithme GNG (Growing Neural Gas) pour gérer le flux de données. G-Stream...
متن کاملStructuration automatique de flux télévisuels
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملUn Modèle Homogène pour la Confidentialité et l'Intégrité des Données Relationnelles
Les systèmes d’information sont devenus omniprésents dans les organisations, et ne sont plus cantonnés à un nombre limités d’applicatifs : qu’il s’agissent de données d’exploitation, de rapports confidentiels ou d’une devanture accessible sur Internet, les systèmes d’information s’étendent dans toutes les branches des organisations. La sécurité est aujourd’hui un des enjeux considérables des sy...
متن کامل